随机对照临床试验(1/5): 概述
随机对照试验是测试医学干预措施效果最严谨、最可靠的科学方法。这是几百年来医学积攒的智慧,是科学逻辑和方法在医学实践中的应用,是医学实践之所以能站到科学肩膀之上的理由。随机对照试验的研究证据已渗透到了临床实践的所有角落。否定对随机对照试验的信念,一个人就站到了现代科学医学的对立面,他将失去思考和行动的罗盘,他的信念将会与现代医学格格不入。
与前述两种研究相比,随机对照试验的最大特点是,研究者用特定的方式,即随机的方式,将研究对象分成两组或多组,随机分组形成的比较组之间的背景因素可达到均衡分布,彼此几乎完全可比,完美解决了队列研究和病例对照研究中的混杂问题。在流行病学研究设计的科学性上,随机对照试验是队列研究之上的一次跳跃性提高。随机对照试验是最严谨的流行病学研究设计类型,是评估医学干预效果最严谨的研究类型。
虽然在研究因果关系方面,随机对照试验高于队列研究,但是由于伦理的限制,随机对照试验不能用来研究疾病的危险因素,也就是说,研究者不能按照自己的意愿,给研究对象施加对健康可能有害的因素,如可疑的危险因素。因此,随机对照试验只能用来检验对健康有益的因素或措施(如可能有益的治疗、预防措施)对人体的作用。
这些可以人为施加的对健康有益的因素和措施,就是医学用来改善人们健康的干预措施。评估医学干预措施效果的重要性显而易见,因为医学资源有限,很多干预措施都有一定的不良作用,使用无效的措施不但浪费资源,还会给病人带来不必要的伤害。评估医学措施的效果是医学研究的重要任务之一。
二、发展简史
医生对受治病人的观察,也许是人们验证干预措施效果最原始、最朴素、最简便的方法。然而,现代生物医学实验研究的两个主要特征是采用对照和对实验条件的严格控制,后者的目的是保证试验组和对照组间在整个研究过程中的可比性。比如,在动物实验中,可以采用同窝的动物作为对照,可以严格控制用药途径、剂量和时间,以及限制和统一动物的生活环境和条件,保证比较组间的可比性。然而,由于伦理等因素的限制,这些措施在人群研究中是不可行的。因此,验证治疗效果的科学方法的发展,主要集中在对照组必要性的认识和如何获得可比的对照组两个方面。
最早记载的对照研究可以追溯到十八世纪中叶。1747年,英国的Lind医生将12名坏血病患者分为六组,每组两人,分别给予不同的膳食治疗,发现橙汁和柠檬汁有利于坏血病病人的康复。虽然Lind已经意识到组间病人可比性的问题,并采取了配对的方式来减少组间病人转归因素的差异,但是他的分组方式本质上是人为安排的,分组因素可能与疾病的转归因素相关,因而组间病人转归的区别不能肯定地归因于治疗方法的差别。
1662年,Van Helmont医生怀疑当时盛行的放血疗法的临床价值,向同行提出了一个大胆的挑战,建议找几百个发热或胸膜炎的病人作为研究对象,为了公平比较,并建议用抽签的方式将病人分为两组,一组病人用非放血的方法治疗,另一组接受放血治疗,然后看哪组病人的转归更好。虽然他的挑战并没有付诸实践,但他提出的抽签分组以达到公平比较的思想,对研究方法的进步有着重要的启示。
抽签也曾用来解决临床研究中对病人公正的问题。有时研究所比较的治疗的益处相差很大,如比较一个可能很有效的药物与无作用的安慰剂。若让病人自己选择接受哪种治疗,显然不合适,可能很少人会选择安慰剂。若由研究者来决定,分到安慰剂组的病人会觉得对他们不公平,而退出研究。为了解决这个问题,研究者曾采用抽签的方式决定病人的分组,多数病人可能不会接受人为不公平的分配,但往往会接受“命运”的裁决。当然,也可以用掷骰子和抛硬币分组的方法,以达到公平分组的目的。
通过几百年的努力,二十世纪中叶,医学确立了评估和比较不同干预措施效果最可靠的方法,这就是随机对照试验。
三、实例
早期随机对照试验的范例是1948年英国医学研究总局进行的链霉素治疗肺结核的试验。其主要目的是确定链霉素治疗肺结核的效果。该试验对107例急性进展性双侧肺结核新发病例进行了研究。符合入选标准的病人,55人被随机分入治疗组,52人分入对照组。治疗组病人接受链霉素治疗和卧床休息,对照组只卧床休息。随机分组的方法是基于随机数字表产生随机分组序列,并通过密闭信封的应用,使得医生和病人无法预先得知随机分组的方案。信封上只有医院名称和一个编号。当病人符合入选标准的时候,随机分组中心将通过医生随机拿给病人一个信封,打开信封,信封中的卡片将决定病人分配到链霉素组或卧床休息组,这一信息将同时反馈到随机分组中心登记备案。试验开始前,链霉素组病人不知道将接受的是特殊的治疗,卧床休息组病例也不知道他们在住院期间将会是一个特殊研究的对照组病人,通常他们和链霉素组病例不住同一个病房。链霉素组病例每天接受一日四次每隔6小时一次共计2g的链霉素注射治疗,研究期间未发现由于毒副作用需要中止治疗的病例。
6个月后,结果发现,7%的链霉素组病例和27%的卧床组病例死亡。影像学显示51%的链霉素组病例和8%的卧床组病例病情有明显改善,18%的链霉素组病例和25%的卧床组病例略有改善。链霉素组病例临床症状的改善也比卧床组病例明显。8例链霉素组病例和2例卧床组病例结核杆菌试验结果呈阴性。
四、基本框架
五、常见名词和概念
(一) 干预措施
(二) 干预组和对照组
最简单最常见的对照试验是有两个平行比较组的试验。本章将统一把接受被评估的干预的一组叫干预组(intervention group),给予对照干预(如安慰治疗、无干预或另一种干预)的一组叫对照组(control group)。
(三) 结局与干预的作用
(四) 效力和效果
干预的效力(efficacy)是干预措施在理想条件下所能达到的治疗作用的大小,是干预措施的最大期望效果。所谓理想的条件,主要由诊断的准确性、病人的依从性、以及医生的技能等因素决定。尤其对药物性治疗来说,效力是一个药物自身的生物学特征。
干预的效果(effectiveness)是在实际医疗卫生条件下干预措施所能达到的治疗作用的大小。干预效果有时又称临床效果或临床疗效,或简称为效果或疗效。因此,医疗条件越好,即诊断的准确性、病人的依从性以及医生的技能越高,就越能实现一个干预措施的最大潜力,疗效也就越大。反之,疗效就越小。
因此,效果是效力和医疗卫生服务条件和水平的综合结果,不是一项干预的普遍的生物学特征,它的大小往往随地区和人群的不同而不同。也就是说,一项干预措施在实际应用时的作用的大小,主要由效力和外在的医疗卫生条件两个因素决定。
(五) 安全性和不良作用
安全与危险成反比。一项干预措施的不良作用(adverse reaction)越大,其安全性(safety)就越低。不良作用一般由副作用(side effect)引起,其大小表现在受治人群中不良反应事件发生频率的高低。一项干预措施产生不良反应的危险就是不良反应产生的概率。与疗效的估计一样,干预组和对照组之间不良反应事件频率的差别,才真正反映干预措施不良作用的大小。
(六) 干预的益害比
任何医学干预措施,不管是否有效,都或多或少有一定的不良作用,如果没有明显的不良作用,至少实施时耗费(人力、物力和财力)资源。一项有价值的干预措施必须益处大于害处,医疗卫生服务才不至于做无用功。在评估干预措施效果时,不但要了解干预的有益作用,还要知道其不良作用,才能权衡其益害比例,作出全面正确的评价。
按照疗效和不良作用的对比(benefit-harm ratio),可把医学干预措施分为三类:益处大于害处,害处大于益处,益害比相当。值得注意的是,即使是益大于害的干预措施,其益害比会随着服务条件和水平的降低而降低,甚至会由益大于害变成害大于益。当然,益害比相当的治疗也不是没用,其用途取决于人们对益处和害处的偏好,决定会因人而异。
(本文是全文5个部分的第1部分,未完待续)
唐金陵,广州市妇女儿童医疗中心临床研究总监、香港中文大学荣休教授
江宇,北京协和医学院公共卫生学院副院长、流行病与卫生统计学教授